1
La arquitectura basada en Markdown y la infraestructura central
EvoClass-AI007Lección 3
00:00

La filosofía de "El archivo como verdad"

La base de OpenClaw es la filosofía de Markdown primero. A diferencia de los sistemas tradicionales de inteligencia artificial de caja negra, OpenClaw trata la configuración como documentación. Cada aspecto de la existencia de un agente—su personalidad, sus capacidades y sus flujos operativos—se almacena en archivos Markdown legibles por humanos. Esto garantiza que la "fuente de verdad" sea transparente, controlada por versiones y fácilmente editable tanto por humanos como por modelos de lenguaje (LLMs).

  • SOUL.md: La identidad central y el compás moral.
  • SKILL.md: El manifiesto que define lo que el agente puede hacer realmente.
  • AGENTS.md: El plano de ingeniería para la orquestación multiagente.

La pila de infraestructura central

Para pasar de archivos estáticos a un agente vivo, OpenClaw utiliza una arquitectura de backend robusta diseñada para estabilidad y flexibilidad:

  1. Entorno de ejecución del agente: La sala de máquinas que gestiona la cola de canales. Garantiza que las tareas asíncronas se procesen sin causar corrupción de estado, manteniendo aislamiento de sesión a través de cada interacción.
  2. Gateway: El plano de control que maneja la identidad de red y el enrutamiento del modelo. Actúa como un escudo de seguridad, reduciendo riesgos como ejecución remota de código (RCE) en la API de WebSocket.
  3. Capa de herramientas: Una interfaz modular donde el agente se conecta a funciones externas, APIs y scripts locales definidos en el manifiesto de habilidades.
  4. Motor independiente de modelo: El sistema no está atado a un único proveedor. Puede cambiar entre Claude, GPT o modelos locales mediante el openclaw.json enrutador.
  5. Superficies y canales: Son los puntos de interacción (interfaz web, terminal o móvil) donde el agente se manifiesta ante el usuario.
Configuración: openclaw.json
{ "identidad_de_red": "agente-01-alpha", "enrutamiento_de_modelo": { "primario": "anthropic/claude-3-opus", "respaldo": "local/llama-3-8b" }, "inyección_de_entorno": { "pasar_seguro": verdadero, "política": "prevenir_fuga" } }
Escriba un comando...
Pregunta 1
¿Por qué OpenClaw prioriza la filosofía de Markdown primero?
Para que los archivos se vean mejor en un editor de texto.
Para asegurar que la configuración sirva como fuente definitiva y legible por humanos.
Para evitar la necesidad de un modelo de lenguaje durante la ejecución.
Pregunta 2
¿Qué componente es responsable de prevenir la corrupción de estado durante tareas multiagente?
La capa de herramientas
El Gateway
El entorno de ejecución del agente (vía cola de canales)
Desafío: Brecha de seguridad
Mitigación de riesgos de RCE en canales públicos.
Escenario: Está desplegando un agente en un canal público de Discord. Observa que el agente intenta ejecutar comandos de shell no verificados, creando un riesgo de RCE (ejecución remota de código) riesgo.
Seguro
¿Cómo utiliza el Gateway y SKILL.md para proteger la infraestructura?
Solución:
1. Nivel de Gateway: Restrinja el puerto de la API WebSocket (18789) solo al tráfico local o implemente tokens de autenticación estrictos.
2. Nivel de SKILL.md: Defina permisos estrictos en los metadatos YAML para la capa de herramientas.
3. Nivel de instrucción: Actualice el funnel de filtrado de seis capas dentro del manifiesto de habilidades para rechazar cualquier cadena de comando que contenga operadores de shell sensibles.